69精品人人人人,一本色道久久综合亚州精品蜜桃,成人亚洲性情网站WWW在线观看,久久国产乱子伦免费精品无码

聯(lián)
咨詢熱線:

185-9527-1032

聯(lián)系QQ:

2863379292

官方微信:

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法

網(wǎng)站優(yōu)化

導(dǎo)讀:搜索引擎會(huì)給予每一個(gè)頁(yè)面一定的權(quán)重值,這個(gè)值也會(huì)隨著頁(yè)面的更新和時(shí)間地流逝而改變。今天,小小課堂SEO自學(xué)網(wǎng)為大家?guī)?lái)的是《SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法》。希望

發(fā)表日期:2019-10-27

文章編輯:興田科技

瀏覽次數(shù):10850

標(biāo)簽:

搜索引擎會(huì)給予每一個(gè)頁(yè)面一定的權(quán)重值,這個(gè)值也會(huì)隨著頁(yè)面的更新和時(shí)間地流逝而改變。

今天,小小課堂SEO自學(xué)網(wǎng)為大家?guī)?lái)的是《SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法》。希望對(duì)大家有所幫助。

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

一、索引創(chuàng)建中的權(quán)值

搜索引擎蜘蛛的爬行與抓取,頁(yè)面的收錄與索引,是一個(gè)頁(yè)面能夠在用戶搜索關(guān)鍵詞時(shí)能夠獲得展現(xiàn)的幾個(gè)基本步驟,其中索引創(chuàng)建中包含著對(duì)頁(yè)面內(nèi)容本身的加權(quán)因素。

① 索引項(xiàng)權(quán)值概念

索引項(xiàng)的權(quán)值,在一定程度上反應(yīng)了文檔中詞的相對(duì)重要性,這個(gè)值通常用于索引排序過(guò)程中計(jì)算分值,也就是影響搜索引擎排序的重要因素之一。

② 索引項(xiàng)權(quán)值怎么得來(lái)的?

索引項(xiàng)權(quán)值,是由檢索模式中的加權(quán)組件利用文檔統(tǒng)計(jì)結(jié)果來(lái)計(jì)算得出的。

③ 索引項(xiàng)加權(quán)方法

傳統(tǒng)的檢索模式中最常見(jiàn)的加權(quán)方法:TF-IDF算法。

二、TF-IDF算法

① TF-IDF算法定義

TF-IDF算法,基于索引項(xiàng)出現(xiàn)在一個(gè)文檔中的次數(shù)或頻率,以及索引項(xiàng)在整個(gè)文檔集合中出現(xiàn)的頻率,兩者的組合(或者說(shuō)兩者的乘積)。

② TF-IDF算法中詞的解析

1)TF

次數(shù)和頻率稱之為詞頻,英文簡(jiǎn)稱為tf。

2)IDF

索引項(xiàng)在整個(gè)文檔集合中出現(xiàn)的頻率,稱之為范文檔頻率,英文簡(jiǎn)稱為idf。

③ TF-IDF算法的簡(jiǎn)單說(shuō)明

TFIDF的核心思想,是指某個(gè)詞或某個(gè)短語(yǔ)在一篇文檔中出現(xiàn)的頻率高,并且在索引庫(kù)的其他文檔中出現(xiàn)較少,就認(rèn)為這個(gè)詞或短句有很好的類別區(qū)分能力,可以用來(lái)進(jìn)行分類。

簡(jiǎn)單來(lái)講,某個(gè)詞或某個(gè)短語(yǔ)就是索引詞,對(duì)于這篇文章而言,該詞項(xiàng)將被賦予較高的權(quán)值。

打個(gè)比方說(shuō),“TWNM-SEO”這個(gè)短語(yǔ)完全是小小課堂網(wǎng)提出的,在《全網(wǎng)營(yíng)銷SEO【TWNM-SEO】這就是屬于我的網(wǎng)站優(yōu)化》一文中,這個(gè)短語(yǔ)出現(xiàn)的頻率非常高,同時(shí),在此之前也沒(méi)有其他人提到過(guò)這個(gè)短語(yǔ),那么對(duì)于這篇文檔來(lái)講,該詞項(xiàng)“TWNM-SEO”就被賦予了很高的權(quán)值。

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

三、理解并使用TF-IDF算法

對(duì)于SEOer來(lái)講,了解上面的知識(shí)已經(jīng)足夠了,沒(méi)必要非得知道是用哪個(gè)函數(shù),哪個(gè)公式算出來(lái)的結(jié)果。

其實(shí),通過(guò)TF-IDF算法的學(xué)習(xí),我們可以更好理解一些常識(shí)性的SEO知識(shí)。

① 品牌詞容易優(yōu)化

品牌詞一般是自己創(chuàng)造的,滿足TF值大,同時(shí)IDF值大,頁(yè)面加權(quán)高,自然排名很容易。

② 行業(yè)核心詞難優(yōu)化

無(wú)數(shù)網(wǎng)站都在優(yōu)化這同一個(gè)詞,然而首頁(yè)的位置卻是有限的,大家都滿足TF大,但同樣IDF越小,證明這個(gè)詞越難優(yōu)化。

這也就是平時(shí)在判斷關(guān)鍵詞優(yōu)化難度時(shí),為什么將百度搜索的相關(guān)結(jié)果數(shù)作為優(yōu)化難度之一的原因。

③ 多挖掘沒(méi)有百度指數(shù)的關(guān)鍵詞-降低優(yōu)化難度

行業(yè)中有百度指數(shù)的詞,大家都在做優(yōu)化與排名,這樣的詞不光是競(jìng)爭(zhēng)壓力大,可能還帶不來(lái)多少點(diǎn)擊。因?yàn)榘俣戎笖?shù)可能是100,真實(shí)用戶也許只有2個(gè),另外的98個(gè)都是企業(yè)的競(jìng)爭(zhēng)者們。

我們應(yīng)該挖掘一些沒(méi)有百度指數(shù)的詞,但是需要這次保持一定的搜索量,這樣可以保證降低優(yōu)化難度的同時(shí),帶來(lái)更多真實(shí)流量。

④ TF并不是萬(wàn)能!過(guò)度堆積害處大!

根據(jù)TF-IDF算法,很多人會(huì)想,增加關(guān)鍵詞密度或頻率,以增加TF值,從而獲得更好的排名。然而,這種做法可以適當(dāng)做,但超過(guò)一定度的話,沒(méi)什么好處,反而可能會(huì)因?yàn)檫^(guò)度堆積被搜索引擎降權(quán)!

所謂的2%~8%的關(guān)鍵詞密度只是個(gè)大概范圍,很多排名好的頁(yè)面很多都在2%一下,當(dāng)然也有在8%以上的,只要密度不是過(guò)小,不必過(guò)度在乎這個(gè)。

舉個(gè)例子,已經(jīng)是5%的密度了,非要故意堆積到8%,甚至百分之20%,就會(huì)變得非常沒(méi)有意義。這是對(duì)TF高的一種誤解。

也就是我們能夠根據(jù)TF-IDF算法中得到的啟發(fā)是不應(yīng)該讓關(guān)鍵詞的密度或頻率(TF)過(guò)低,然而對(duì)于IDF來(lái)說(shuō),我們只能通過(guò)尋找IDF值高的關(guān)鍵詞來(lái)優(yōu)化,如果我們優(yōu)化的關(guān)鍵詞的IDF值本來(lái)就很低,我們也不能對(duì)其改變這個(gè)現(xiàn)狀,IDF值越低,證明這個(gè)詞在一定程度上就越難優(yōu)化。

所以,在網(wǎng)站優(yōu)化過(guò)程中,除了要做好頁(yè)面外,還需要關(guān)注內(nèi)鏈與外鏈優(yōu)化。

四、TF-IDF算法公式

① TF公式

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

TF(i,j):關(guān)鍵詞j在文檔i中的出現(xiàn)頻率。

n(i,j):關(guān)鍵詞j在文檔i中出現(xiàn)的次數(shù)。

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

舉例來(lái)講:

一篇文章總共100個(gè)詞,其中“SEO培訓(xùn)”一共出現(xiàn)了10詞,那么TF就是10/100,結(jié)果就是0.1。

然而,由于文章中會(huì)出現(xiàn)大量的“的”、“得”、“嗎”、“地”,不能正常反應(yīng)文章的詞,所以,就得用IDF來(lái)做一個(gè)限制了。

② IDF公式

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

IDF(i):詞語(yǔ)i的反文檔頻率

|D|:語(yǔ)料庫(kù)中的文件總數(shù)

|j:t(i)屬于d(j)|出現(xiàn)詞語(yǔ)i的文檔總數(shù)

+1是為了防止分母變0。

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

IDF就可以防止常用詞的干擾了。

還是剛才的例子:

一篇文章總共100個(gè)詞,其中“SEO培訓(xùn)”一共出現(xiàn)了10詞,那么TF就是10/100,結(jié)果就是0.1。

另外“我們”一共出現(xiàn)了10詞,其TF結(jié)果也是0.1。

假設(shè)語(yǔ)料庫(kù)總共有1000篇文章,其中“SEO培訓(xùn)”文章有10篇,“我們”文章有1000篇。

“SEO培訓(xùn)”的IDF=log(1000/10)= 2

“我們”的IDF=log(1000/1000)= 0

③ TF-IDF公式

TF-IDF = TF*IDF

SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法 如何網(wǎng)站設(shè)計(jì)

“SEO培訓(xùn)”的TF*IDF=0.1*0=0

“我們”的TF*IDF=0.1*2=0.2

那么很顯然,對(duì)于這篇文章而言,“SEO培訓(xùn)”比“我們”更加重要。

以上就是小小課堂SEO自學(xué)網(wǎng)為大家?guī)?lái)的是《SEOer應(yīng)善用索引創(chuàng)建過(guò)程中的加權(quán)方法》。感謝您的觀看。SEO培訓(xùn)認(rèn)準(zhǔn)小小課堂!更多seo教程搜索小小課堂。原創(chuàng)文章歡迎轉(zhuǎn)載并保留版權(quán):https://www.xxkt.org/

本文來(lái)源:A5

相關(guān)推薦

更多新聞

  • 11-15

    2020

    網(wǎng)站優(yōu)化 / 2020-11-15

    果斷收藏:白帽是seo的唯一選擇嗎?

      關(guān)于seo人生在世,很多人都想走捷徑,想不付出或付出很少都會(huì)有大的回報(bào)。這也是SEO優(yōu)化中的一個(gè)例子,即黑帽子SEO。能在短時(shí)間內(nèi)讓你的網(wǎng)站有好的排名,但對(duì)

    View details

  • 11-23

    2020

    網(wǎng)站優(yōu)化 / 2020-11-23

    果斷收藏:中學(xué)學(xué)歷可以做seo嗎?

      關(guān)于seo,從事seo工作與學(xué)歷無(wú)關(guān),而且很少有真正的高學(xué)歷從事seo工作。具有初中學(xué)歷的人可以做好seo,而且可以做好。在seo這個(gè)行業(yè)里,有很多草根出身的朋友

    View details

  • 11-25

    2020

    網(wǎng)站優(yōu)化 / 2020-11-25

    不得不知seo好學(xué)嗎?學(xué)習(xí)比做容易得多!

      身為一名seo老手,對(duì)于了解seo網(wǎng)站優(yōu)化來(lái)說(shuō),學(xué)習(xí)它相對(duì)容易,但是能夠正確理解相應(yīng)的理論,能夠在適當(dāng)?shù)臅r(shí)間,適當(dāng)?shù)牡攸c(diǎn)使用適當(dāng)?shù)膕eo技術(shù),并產(chǎn)生良好的排序結(jié)

    View details

  • 11-18

    2020

    網(wǎng)站優(yōu)化 / 2020-11-18

    不得不知網(wǎng)站優(yōu)化做得好從哪里入手?

      關(guān)于網(wǎng)站優(yōu)化,會(huì)進(jìn)行一些與用戶體驗(yàn)有關(guān)的優(yōu)化,如果某個(gè)網(wǎng)站不考慮這方面,只考慮跳出率,那么在這種情況下用戶體驗(yàn)會(huì)很差,所以想要做好網(wǎng)站就必須考慮用戶

    View details